入力したテキストに合わせて自動でまるでホンモノの写真のようなクオリティの高い画像を生成することができる人工知能(AI)が「Stable Diffusion」です。そんなStable DiffusionはCreative ML OpenRAIL-Mライセンスの下でリリースされており商用利用も可能ですが、ローカル環境で利用するにはNVIDIA製GPUを搭載した端末が必要となっています。そんなStable Diffusionを、多くのWindows搭載PCが採用しているIntel製CPUで実行できるようにした「stable_diffusion.openvino」が登場しました。GitHub - bes-dev/stable_diffusion.openvinohttps://github.com/bes-dev/stable_diffusion.openvino
「Stable Diffusion」は、入力したテキストに沿った画像を生成できるAIです。 「ビーチで風船を持つ女の子」「エッフェル塔を眺めながら高級料理を食べるピカチュウ」「秋葉原で犬と戦うスパイダーマン」など、人間でも描くのが難しい画像であっても、想像以上のクオリティで生成してしまいます。キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた - GIGAZINE
Stable Diffusionはウェブ上で使えるデモ版の他、ローカル環境で実行することも可能。さらに、Stable Diffusionを低スペックPCでも無料かつ待ち時間なしで使うことができます。低スペックPCでもStable Diffusionを利用できるようにする方法は、以下の記事にまとめられています。画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE
「stable_diffusion.openvino」はOpenVINOに対応したIntel製CPUを搭載したマシンで動作可能。OSはWindows・macOS・Linuxに対応しており、対応CPUとバージョン3.8以降のPython実行環境さえ用意すれば画像生成を実行できます。以下の画像は「Street-art painting of Emilia Clarke in style of Banksy, photorealism(バンクシー風にエミリア・クラークのストリートアートをスーパーリアリズムで)」というテキストから、Stable Diffusionが生成した画像。
なお、エンジニアのkaraage0703さんがWindowsにWSL2をインストールし、Windows上でネイティブLinuxが動作する環境を構築し、pyenvおよびpyenv-virtualenvを使ってPython環境を構築し、「stable_diffusion.openvino」を利用する手順を公開しています。Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法https://zenn.dev/karaage0703/articles/4901bf68536907karaage0703さんによると、IntelのCore i7を搭載したゲーミングPCで「stable_diffusion.openvino」を利用した場合、2分弱ほどで1枚の画像を生成することができた模様。なお、以下の画像は「karaage(唐揚げ)」というテキストを入力して生成された画像です。
実行したコマンドは以下の通りです。
$ python stable_diffusion.py --prompt "karaage"ftfy or spacy is not installed using BERT BasicTokenizer instead of ftfy.32it [01:41, 3.18s/it]この記事のタイトルとURLをコピーする・関連記事キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた - GIGAZINE画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE画像生成AI「Stable Diffusion」をGoogle Colaboratoryで動かして画像の保存先をGoogleドライブにする方法 - GIGAZINE簡単なお絵かきとキーワードだけで思い通りの写真やイラストを自動生成する「img2img」モードを「Stable Diffusion」で誰でも試してみることができるサイト - GIGAZINE
・関連コンテンツ
キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた画像生成AI「Stable Diffusion」などに作らせたい元画像の雰囲気から「呪文っぽい英文」の候補を検索できる「clip-retrieval」「この画像っぽい○○を生成」を画像生成AI「Stable Diffusion」で実現する技術「Textual Inversion」が登場ついに「CLIP STUDIO PAINT(クリスタ)」で画像生成AI「Stable Diffusion」を動かすプラグインが登場画像生成AI「Stable Diffusion」をM1搭載Macのローカル上で実行する方法画像生成AI「Stable Diffusion」をIntel Arcで動かすことに成功Stable Diffusion 3 Mediumがオープンリリースされる、比較的小型で個人利用に最適なモデルにAppleが画像生成AI「Stable Diffusion」にまさかの正式対応、開発者いわく「画像を1秒以内に生成可能」2022年08月31日 09時00分00秒 in ソフトウェア, Posted by logu_ii
You can read the machine translated English article here.